智能论文笔记

Lung-Originated Tumor Segmentation from Computed Tomography Scan (LOTUS) Benchmark

Parnian Afshar , Arash Mohammadi , Konstantinos N. Plataniotis , Keyvan Farahani , Justin Kirby , Anastasia Oikonomou , Amir Asif , Leonard Wee , Andre Dekker , Xin Wu

分类：计算机视觉 | 机器学习

2022-01-03

肺癌是最致命的癌症之一，部分诊断和治疗取决于肿瘤的准确描绘。目前是最常见的方法的人以人为本的分割，须遵守观察者间变异性，并且考虑到专家只能提供注释的事实，也是耗时的。最近展示了有前途的结果，自动和半自动肿瘤分割方法。然而，随着不同的研究人员使用各种数据集和性能指标验证了其算法，可靠地评估这些方法仍然是一个开放的挑战。通过2018年IEEE视频和图像处理（VIP）杯竞赛创建的计算机断层摄影扫描（LOTUS）基准测试的肺起源肿瘤分割的目标是提供唯一的数据集和预定义的指标，因此不同的研究人员可以开发和以统一的方式评估他们的方法。 2018年VIP杯始于42个国家的全球参与，以获得竞争数据。在注册阶段，有129名成员组成了来自10个国家的28个团队，其中9个团队将其达到最后阶段，6队成功完成了所有必要的任务。简而言之，竞争期间提出的所有算法都是基于深度学习模型与假阳性降低技术相结合。三种决赛选手开发的方法表明，有希望的肿瘤细分导致导致越来越大的努力应降低假阳性率。本次竞争稿件概述了VIP-Cup挑战，以及所提出的算法和结果。

translated by 谷歌翻译

CAE-Transformer: Transformer-based Model to Predict Invasiveness of Lung Adenocarcinoma Subsolid Nodules from Non-thin Section 3D CT Scans

Shahin Heidarian , Parnian Afshar , Anastasia Oikonomou , Konstantinos N. Plataniotis , Arash Mohammadi

分类：计算机视觉 | 机器学习

2021-10-17

肺癌是全世界癌症死亡的主要原因，具有各种组织学类型，其中肺腺癌（Luac）最近是最普遍的。肺腺癌被归类为预侵入性，微创和侵入性腺癌。及时，准确地了解肺结核的侵袭性导致适当的治疗计划，并降低了不必要或晚期手术的风险。目前，主要成像模型评估和预测Luacs的侵袭性是胸部CT。然而，基于CT图像的结果是主观的并且与手术切除后提供的地面真理审查相比，患有低精度。本文开发了一种基于预测变压器的框架，称为“CAE变压器”，以对Luacs进行分类。 CAE变换器利用卷积自动编码器（CAE）来自动从CT切片中提取信息性功能，然后将其馈送到修改的变压器模型以捕获全局切片关系。我们的内部数据集114个病理证明的副实体结节（SSN）的实验结果证明了CAE变压器在直方图/基于射频的模型上的优越性及其基于深度学习的对应物，实现了87.73％，灵敏度的准确性使用10倍交叉验证，88.67％，特异性为86.33％和0.913的AUC。

translated by 谷歌翻译

Robust Framework for COVID-19 Identification from a Multicenter Dataset of Chest CT Scans

Sadaf Khademi , Shahin Heidarian , Parnian Afshar , Nastaran Enshaei , Farnoosh Naderkhani , Moezedin Javad Rafiee , Anastasia Oikonomou , Akbar Shafiee , Faranak Babaki Fard , Konstantinos N. Plataniotis

分类：计算机视觉 | 机器学习

2021-09-19

这项研究的目的是开发一个强大的基于深度学习的框架，以区分Covid-19，社区获得的肺炎（CAP）和基于使用各种方案和放射剂量在不同成像中心获得的胸部CT扫描的正常病例和正常情况。我们表明，虽然我们的建议模型是在使用特定扫描协议仅从一个成像中心获取的相对较小的数据集上训练的，但该模型在使用不同技术参数的多个扫描仪获得的异质测试集上表现良好。我们还表明，可以通过无监督的方法来更新模型，以应对火车和测试集之间的数据移动，并在从其他中心接收新的外部数据集时增强模型的鲁棒性。我们采用了合奏体系结构来汇总该模型的多个版本的预测。为了初始培训和开发目的，使用了171 Covid-19、60 CAP和76个正常情况的内部数据集，其中包含使用恒定的标准辐射剂量扫描方案从一个成像中心获得的体积CT扫描。为了评估模型，我们回顾了四个不同的测试集，以研究数据特征对模型性能的转移的影响。在测试用例中，有与火车组相似的CT扫描，以及嘈杂的低剂量和超低剂量CT扫描。此外，从患有心血管疾病或手术病史的患者中获得了一些测试CT扫描。这项研究中使用的整个测试数据集包含51 covid-19、28 CAP和51例正常情况。实验结果表明，我们提出的框架在所有测试集上的表现良好，达到96.15％的总准确度（95％CI：[91.25-98.74]），COVID-119，COVID-96.08％（95％CI：[86.54-99.5]，95％），[86.54-99.5]，），，），敏感性。帽敏感性为92.86％（95％CI：[76.50-99.19]）。

translated by 谷歌翻译

Human-level COVID-19 Diagnosis from Low-dose CT Scans Using a Two-stage Time-distributed Capsule Network

Parnian Afshar , Moezedin Javad Rafiee , Farnoosh Naderkhani , Shahin Heidarian , Nastaran Enshaei , Anastasia Oikonomou , Faranak Babaki Fard , Reut Anconina , Keyvan Farahani , Konstantinos N. Plataniotis

分类：计算机视觉 | 机器学习

2021-05-31

逆转录 - 聚合酶链反应（RT-PCR）目前是Covid-19诊断中的金标准。然而，它可以花几天来提供诊断，假负率相对较高。成像，特别是胸部计算断层扫描（CT），可以有助于诊断和评估这种疾病。然而，表明标准剂量CT扫描对患者提供了显着的辐射负担，尤其是需要多次扫描的患者。在这项研究中，我们考虑低剂量和超低剂量（LDCT和ULDCT）扫描方案，其减少靠近单个X射线的辐射曝光，同时保持可接受的分辨率以进行诊断目的。由于胸部放射学专业知识可能不会在大流行期间广泛使用，我们使用LDCT / ULDCT扫描的收集的数据集进行人工智能（AI）基础的框架，以研究AI模型可以提供人为级性能的假设。 AI模型使用了两个阶段胶囊网络架构，可以快速对Covid-19，社区获得的肺炎（帽）和正常情况进行分类，使用LDCT / ULDCT扫描。 AI模型实现Covid-19敏感性为89.5％+ - 0.11，帽敏感性为95％+ \ - 0.11，正常情况敏感性（特异性）85.7％+ - 0.16，精度为90％+ \ - 0.06。通过纳入临床数据（人口统计和症状），性能进一步改善了Covid-19敏感性为94.3％+ \ - PM 0.05，帽敏感性为96.7％+ \ - 0.07，正常情况敏感性（特异性）91％+ - 0.09，精度为94.1％+ \ - 0.03。所提出的AI模型基于降低辐射暴露的LDCT / ULDCT扫描来实现人级诊断。我们认为，所提出的AI模型有可能协助放射科医师准确，并迅速诊断Covid-19感染，并帮助控制大流行期间的传输链。

translated by 谷歌翻译

Instance-Dependent Generalization Bounds via Optimal Transport

Songyan Hou , Parnian Kassraie , Anastasis Kratsios , Jonas Rothfuss , Andreas Krause

分类： (统计)机器学习 | 机器学习

2022-11-02

Existing generalization bounds fail to explain crucial factors that drive generalization of modern neural networks. Since such bounds often hold uniformly over all parameters, they suffer from over-parametrization, and fail to account for the strong inductive bias of initialization and stochastic gradient descent. As an alternative, we propose a novel optimal transport interpretation of the generalization problem. This allows us to derive instance-dependent generalization bounds that depend on the local Lipschitz regularity of the earned prediction function in the data space. Therefore, our bounds are agnostic to the parametrization of the model and work well when the number of training samples is much smaller than the number of parameters. With small modifications, our approach yields accelerated rates for data on low-dimensional manifolds, and guarantees under distribution shifts. We empirically analyze our generalization bounds for neural networks, showing that the bound values are meaningful and capture the effect of popular regularization methods during training.

translated by 谷歌翻译

DR.BENCH: Diagnostic Reasoning Benchmark for Clinical Natural Language Processing

Yanjun Gao , Dmitriy Dligach , Timothy Miller , John Caskey , Brihat Sharma , Matthew M Churpek , Majid Afshar

分类：自然语言处理 | 人工智能

2022-09-29

The meaningful use of electronic health records (EHR) continues to progress in the digital era with clinical decision support systems augmented by artificial intelligence. A priority in improving provider experience is to overcome information overload and reduce the cognitive burden so fewer medical errors and cognitive biases are introduced during patient care. One major type of medical error is diagnostic error due to systematic or predictable errors in judgment that rely on heuristics. The potential for clinical natural language processing (cNLP) to model diagnostic reasoning in humans with forward reasoning from data to diagnosis and potentially reduce the cognitive burden and medical error has not been investigated. Existing tasks to advance the science in cNLP have largely focused on information extraction and named entity recognition through classification tasks. We introduce a novel suite of tasks coined as Diagnostic Reasoning Benchmarks, DR.BENCH, as a new benchmark for developing and evaluating cNLP models with clinical diagnostic reasoning ability. The suite includes six tasks from ten publicly available datasets addressing clinical text understanding, medical knowledge reasoning, and diagnosis generation. DR.BENCH is the first clinical suite of tasks designed to be a natural language generation framework to evaluate pre-trained language models. Experiments with state-of-the-art pre-trained generative language models using large general domain models and models that were continually trained on a medical corpus demonstrate opportunities for improvement when evaluated in DR. BENCH. We share DR. BENCH as a publicly available GitLab repository with a systematic approach to load and evaluate models for the cNLP community.

translated by 谷歌翻译

Summarizing Patients Problems from Hospital Progress Notes Using Pre-trained Sequence-to-Sequence Models

Yanjun Gao , Dmitry Dligach , Timothy Miller , Dongfang Xu , Matthew M. Churpek , Majid Afshar

分类：自然语言处理 | 人工智能

2022-08-17

使用自然语言处理方法自动汇总患者的主要进度注释中的主要问题，有助于与医院环境中的信息和认知超负荷作斗争，并可能为提供者提供计算机化的诊断决策支持。问题列表摘要需要一个模型来理解，抽象和生成临床文档。在这项工作中，我们提出了一项新的NLP任务，旨在在住院期间使用提供者进度注释的意见来在患者的日常护理计划中生成一系列问题。我们研究了两个最先进的SEQ2SEQ变压器体系结构T5和Bart的性能，以解决此问题。我们提供了一个基于公开可用的电子健康记录进度注释MART MART（MIMIC）-III中的公开电子健康记录进度注释的语料库。 T5和BART对通用域文本进行了培训，我们尝试了数据增强方法和域适应性预训练方法，以增加医学词汇和知识的接触。评估方法包括胭脂，Bertscore，嵌入句子上的余弦相似性以及对医学概念的F评分。结果表明，与基于规则的系统和通用域预训练的语言模型相比，具有领域自适应预训练的T5可实现显着的性能增长，这表明可以解决问题摘要任务的有希望的方向。

translated by 谷歌翻译

Graph Neural Network Bandits

Parnian Kassraie , Andreas Krause , Ilija Bogunovic

分类：机器学习 | 人工智能 | (统计)机器学习

2022-07-13

我们考虑使用图形结构数据定义的奖励函数的强盗优化问题。这个问题在分子设计和药物发现中具有重要的应用，在图形排列中，奖励自然不变。这种设置的主要挑战是扩展到大型域，以及带有许多节点的图形。我们通过将置换不变性嵌入我们的模型来解决这些挑战。特别是，我们表明图形神经网络（GNN）可用于估计奖励函数，假设它位于置换不变的加性核的再现内核希尔伯特空间。通过在此类内核与图形神经切线内核（GNTK）之间建立新的联系，我们介绍了第一个GNN信心绑定，并使用它来设计一个带有sublinear遗憾的相位脱口算法。我们的遗憾约束取决于GNTK的最大信息增益，我们也为此提供了界限。虽然奖励功能取决于所有$ n $节点功能，但我们的保证与图形节点$ n $的数量无关。从经验上讲，我们的方法在图形结构域上表现出竞争性能，并表现得很好。

translated by 谷歌翻译

Meta-Learning Hypothesis Spaces for Sequential Decision-making

Parnian Kassraie , Jonas Rothfuss , Andreas Krause

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-02-01

在预测功能（假设）中获得可靠的自适应置信度集是顺序决策任务的核心挑战，例如土匪和基于模型的强化学习。这些置信度集合通常依赖于对假设空间的先前假设，例如，繁殖核Hilbert Space（RKHS）的已知核。手动设计此类内核是容易发生的，错误指定可能导致性能差或不安全。在这项工作中，我们建议从离线数据（meta-kel）中进行元学习核。对于未知核是已知碱基核的组合的情况，我们基于结构化的稀疏性开发估计量。在温和的条件下，我们保证我们的估计RKHS会产生有效的置信度集，随着越来越多的离线数据的量，它变得与鉴于真正未知内核的置信度一样紧。我们展示了我们关于内核化强盗问题（又称贝叶斯优化）的方法，我们在其中建立了遗憾的界限，与鉴于真正的内核的人竞争。我们还经验评估方法对贝叶斯优化任务的有效性。

translated by 谷歌翻译

Automated Reinforcement Learning: An Overview

Reza Refaei Afshar , Yingqian Zhang , Joaquin Vanschoren , Uzay Kaymak

分类：机器学习 | 人工智能

2022-01-13

强化学习和最近的深度增强学习是解决如Markov决策过程建模的顺序决策问题的流行方法。问题和选择算法和超参数的RL建模需要仔细考虑，因为不同的配置可能需要完全不同的性能。这些考虑因素主要是RL专家的任务;然而，RL在研究人员和系统设计师不是RL专家的其他领域中逐渐变得流行。此外，许多建模决策，例如定义状态和动作空间，批次的大小和批量更新的频率以及时间戳的数量通常是手动进行的。由于这些原因，RL框架的自动化不同组成部分具有重要意义，近年来它引起了很多关注。自动RL提供了一个框架，其中RL的不同组件包括MDP建模，算法选择和超参数优化是自动建模和定义的。在本文中，我们探讨了可以在自动化RL中使用的文献和目前的工作。此外，我们讨论了Autorl中的挑战，打开问题和研究方向。

translated by 谷歌翻译